技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2023 iThome 鐵人賽
DAY
25
0
AI & Data
嘗試在AI世界闖蕩
系列 第
25
篇
Day 25 AI核心應用:自然語言處理(GPT-3、LM未來)
15th鐵人賽
tiffanyxxx32
團隊
臣無禮
2023-10-10 12:37:33
398 瀏覽
分享至
GPT-3(Generative Pre-trained Transformer 3)
一個基於Transformer Decoder無監督式學習、單向、大型通用式的語言模型。
主要目標在於預測下一句最合理的詞句為任務。
大型GPT-3有1750億個參數,96層Transformer每層有128個Attention Head詞向量的維度為12288。
有各種大小。
訓練數據:來源有Common Crawl DataSet、Web Text、Book1、Book2、Wikipedia。
主要預測方式:
➊Zero Shot(不該有目標樣本):只是描述任務的特性,而不給任何的樣本而讓GPT-3自己去執行。
➋One Shot(只有一個目標樣本):只給一個下游任務的樣本Demo給GPT-3看,而它就要執行此任務。
➌Few Shot(只有少數目標樣本):只用10~100個目標任務的新樣本就可以執行許多下游的任務,而不需要改變原來語言模式內的所有參數權重,不需要做微調的工作。
應用:
1.句子的理解方面:由一個句子來預測最後一個字,主要是要測試其長距離的依賴關係與對句子結構的理解。
2.文本的理解方面:預測文本的結尾。
3.句子面的關係方面:測試其瞭解文本與句子的關係。
4.QA系統:直接在網頁大量的文章中、書本及維基的文本內直接抽取出正確的回答。
5.機器翻譯方面:對各國語言的翻譯。
6.常識與推理Common Sense Reasoning方面
7.閱讀瞭解Redding Compreshension方面:文本摘要、問答系統、聊天機器人。
8.在數學方面:二位數加減完全沒問題,三位數的正確率大約在80%~90%。
9.語意的瞭解方面:SAT的同詞異義與異詞同義正確比率維60%~65%。
10.創造新文本方面:給一個題目,可以寫出一篇文章。
11.句子生成方面:對沒見過的字簡單檢視並自我造句。
風險:
➊誤用的強力語言工具:對於詐騙集團、假消息、垃圾郵件、釣魚網站、論文造假如虎添翼。
➋垃圾進垃圾出:如果輸入的資料有歧視、不公正、辱罵等負面內容,則輸出的結果也會有這種偏差性的內容。
➌品質的問題:社群媒體上的內容品質不高,導致分析出來的內容有品質問題。
➍準確穩定性的問題:結果常出現荒謬錯誤或是專業領域沒經過微調,績效不穩定。
未來Language Moedl
趨勢會往下面幾個走:
更可控制的文本生成:要求文本的出處資料,保障input品質,避免Garbage in Garbage out(GIGO)。
綜合知識圖譜Knowledge Graph(KG)功能:用來清楚瞭解文句中的正確邏輯關係。
更好的道德風險分析:用道德規範的指標來比較不同LM的輸出品質、做倫理道德偏差內容的比較分析,來監督改善LM生成內容與品質符合人類的道德規範。
參考來源:人工智慧:概念應用與管理 林東清
留言
追蹤
檢舉
上一篇
Day 24 AI核心應用:自然語言處理(語言模型、BERT)
下一篇
Day 26 AI核心應用:電腦聽覺與視覺(語音辨識)
系列文
嘗試在AI世界闖蕩
共
31
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
27
Day 27 AI的核心應用:電腦的聽覺與視覺(TTS、、Real Time Voice Cloning、CV)
28
Day 28 AI的核心應用:電腦的聽覺與視覺(圖像分析/分類/分割/定位、物件偵測)
29
Day 29 AI的核心應用:電腦的聽覺與視覺(R-CNN、YOLO)
30
Day 30 AI的核心應用:電腦的聽覺與視覺(視頻分析、行動辨識)
31
技術篇 Day 1-Iris_classification
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22201
篇
完賽人數
602
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
熟識南投軟體工程師推薦
如何練國考資訊題?
筆電無法使用usb開機重裝系統
CCNA相關問題詢問
電商在販售商品時,可以自行縮短保固期限嗎?
求救 有人會修改cookie權限嗎
python scrapy pipeline實作問題請教
防火牆互通問題
函數問題
桌面的使用者文件圖標壞掉
熱門回答
防火牆互通問題
筆電無法使用usb開機重裝系統
if函數中的>&<&=是否可以使用儲存格代替
開啟Microsoft Edge 瀏覽器無法開啟網頁,出現錯誤訊息
熟識南投軟體工程師推薦
熱門文章
每日一篇學習筆記 直到我做完專題 :( [Day1]
每日一篇學習筆記 直到我做完專題 :( [Day2]
[翻譯]使用AI工具寫程式碼時如何避免「AI幻覺」?
每日一篇學習筆記 直到我做完專題 :( [Day3]
每日一篇學習筆記 直到我做完專題 :( [Day4]
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}